Domaći III

Linearna i logistička regresija

Student: Vidojević Mirjana (34 / 2025)

Baza podataka

Za potrebe prvog domaćeg koristićemo dio baze podataka koja sadrži informacije o nivou ekonomskog i političkog razvoja. Datoteka dodijeljena svakom studentu sadrži između 100 i 150 redova (država) i 10 kolona (varijabli). Detaljan opis varijabli nalazi se u Tabeli 1:

Tabela 1. Pregled varijabli u bazi podataka

Varijabla Opis Skala
naziv Ime države Nominalna
razvoj Indeks ljudskog razvoja (HDI) Intervalna
rezim Kojeg je tipa politički režim Nominalna
gini Indeks ekonomske nejednakosti (GINI) Intervalna
frak Nivo etničke frakcionalizacije Ordinalna (kategorička)
vijek Prosječno trajanje životnog vijeka Intervalna
urban Udio urbanog stanovništva u populaciji Intervalna
nejed Nivo rodne nejednakosti Intervalna
oecd Da li je država članica OECD Ordinalna (kategorička)
nivodem Nivo demokratije Intervalna

Zadatak

  1. Učitati bazu podataka vidojević-mirjana-III.xlsx u R.

  2. Rekodirati nedostajuće vrijednosti na svakoj varijabli.

  3. Izračunati Pirsonovu linearnu korelaciju između nivoa razvoja (HDI) i prosječnog životnog vijeka. Interpretirati rezultat.

  4. Grafički prikazati korelaciju između dvije varijable.

  5. Kreirati linearni model (OLS) koristeći nivo razvoja (HDI) kao zavisnu varijablu, a prosječni životni vijek, indeks ekonomske nejednakosti (GINI) i nivo demokratijekao nezavisne varijable.

    1. Interpretirati rezultate.

    2. Grafički prikazati odnos između nivoa razvoja (HDI) i indeksa ekonomke nejednakosti (GINI).

  6. Kreirati novi linearni model dodavanjem još dvije nezavisne varijable: nivo etničke frakcionalizacije i članstvo države u OECD.

    1. Obrazložiti način na koji je varijabla nivo etničke frakcionalizacije uključena u analizu?

    2. Interpretirati rezultate novog modela.

    3. Uporediti kvalitet i rezultate prvog i drugog modela.

  7. Kreirati logistički model na osnovu kojeg možemo izračunati uticaj indeksa ekonomke nejednakosti (GINI), nivoa demokratije i prosječnog životnog vijeka na nivo etničke frakcionalizacije.

    1. Interpretirati rezultate.

    2. Koji procent slučajeva je model tačno predvidio?

  8. Kreirati logistički model na osnovu kojeg možemo izračunati vjerovatnoću članstva države u OECD-u koristeći iste nezavisne varijable kao u slučaju prvog logističkog modela.

    1. Interpretiraj rezultate.

    2. Koji procent slučajeva je model tačno predvidio?

  9. Koristeći prvi logistički model izračunaj kolika je vjerovatnoća da će država etnički heterogena , sa nivoom demokratije 7 , sa prosječnim trajanjem životnog vijeka od 71 biti članica OECD-a. Interpretirati rezultat.

Instrukcije

  1. Rok za predaju domaćeg zadatka je 1.6.2026. u 13.00. Radove poslati na nbatricevic.fpn@gmail.com.

  2. Domaći zadatak dostaviti u Word formatu. Naziv fajla bi trebalo da prati format: Domaci_III_Vidojević_Mirjana

  3. Fajl sa domaćim zadatkom trebalo bi da sadrži: kod, rezultat (output iz konzole) i interpretaciju.

Napomena: nepotpuni domaći zadaci neće biti pregledani.